pandas: Series
indexで要素にアクセスできる
code:py
s.array
# <NumpyExtensionArray>
PandasArrayと同じものなのかそうでないのかわからない #?? pd.Series
code:python
print(s) # 出力: 0 1
# 1 2
# 2 3
# 3 4
# 4 5
# dtype: int64
code:python
print(s) # 出力: a 1
# b 2
# c 3
# d 4
# e 5
# dtype: int64
code:python
s = pd.Series({'a': 1, 'b': 2, 'c': 3})
print(s) # 出力: a 1
# b 2
# c 3
# dtype: int64
Series.index
インデックス(ラベル)のリストを取得
code:python
Series.values
データの配列を取得
code:python
print(s.values) # 出力: 1 2 3
Series.dtype
データの型を取得
code:python
print(s.dtype) # 出力: int64
Series.name
code:python
s.name = "my_series"
print(s.name) # 出力: my_series
インデックス参照
インデックス(ラベル)を指定して要素を取得
code:python
スライス
インデックス範囲を指定して複数の要素を取得
code:python
# b 2
# c 3
# dtype: int64
ブールインデックス
条件に基づいて要素をフィルタリング
code:python
# dtype: int64
おもろい構文だなmrsekut.icon
値の更新
指定したインデックスの値を更新
code:python
print(s) # 出力: a 10
# b 2
# c 3
# dtype: int64
要素ごとの演算
各要素に対してスカラー値の演算を行う
code:python
print(s + 2) # 出力: a 12
# b 4
# c 5
# dtype: int64
code:python
print(s1 + s2) # 出力: a 5
# b 7
# c 9
# dtype: int64
欠損値への対応
code:python
print(s1 + s3) # 出力: a 8.0
# b NaN
# c NaN
# d NaN
# dtype: float64
- sum: 要素の合計を計算
- mean: 要素の平均を計算
- max, min: 要素の最大値、最小値を計算
- count: 非欠損値の要素数を計算
- value_counts: ユニークな値の出現回数をカウント
code:python
print(s.sum()) # 出力: 28
print(s.mean()) # 出力: 3.5
print(s.max()) # 出力: 5
print(s.value_counts()) # 出力: 5 3
# 3 2
# 1 1
# 2 1
# 4 1
# dtype: int64
append
code:python
print(s.append(s4)) # 出力: 0 1
# 1 2
# 2 3
# 3 3
# 4 4
# 5 5
# 6 5
# 7 5
# f 6
# g 7
# dtype: int64
drop
指定したインデックスの要素を削除
code:python
# d 4
# e 5
# dtype: int64